import pandas as pd
import matplotlib.pyplot as plt


# 1.载数据
df = pd.read_excel("2020年销售数据.xlsx")
print(df.head())


# 2.数据清洗(重复值)
# print(len(df))
df = df.drop_duplicates("销售订单")
# print(len(df))
# 3.统计计算
# 计算销售额
df['销售额']=df['售价']*df['销售数量']
# print(df.head())
#提取月份
df['月']=df['销售日期'].dt.month
# print(df.head())

# 按品牌分组
pp_group = df.groupby('品牌')['销售额'].sum()
#按地区分组
dq_group = df.groupby('销售区域')['销售额'].sum()
#地区-月份
dqy_group = df.groupby(['销售区域','月'])['销售额'].sum()
#4.可视化
plt.rcParams['font.sans-serif']=['SimHei']
#品牌销售额
pp_group.plot(kind='bar')
plt.show()
#销售区域的销售额对比
dq_group.plot(kind='bar')
plt.show()
#销售区域每个月的销售额对比
dqy_group.unstack().plot(kind='bar')
plt.show()

